微软推出深度视频探索智能体,登顶多个长视频理解基准 微软推出深度视频探索智能体,登顶多个长视频理解基准 关键词: AI,模型训练,Deep Video Discovery,人工智能 尽管大型语言模型(LLMs)和大型视觉 - 语言模型(VLMs)在视频分析和长语境处理方面取得了显著进展,但它们在处理信息密集的数小时长视频时仍显示出局限性。 来自主题: AI技术研报 5980 点击 2025-06-30 14:34